"إسلوب التعدين المحسّن لتحليل وتنبؤ تركيب البروتينات"

نيفين عاطف هلال أمين جامعة عين شمس كلية الحاسبات والمعلومات قسم نظم المعلومات الماجيستير 2008 115

"التقدم السريع فى مجال جمع و تخزين البيانات أدى الى ظهور بعض البيانات الأكثر تعقيدا. هذه البيانات المعقدة يمكن أن تشمل وثائق شبه منظمة، سلسلة تتابع الأحماض النووية، و التركيب ثلاثى الأبعاد للبروتينات. التقنيات المستخدمة لتعدين هذه البيانات يجب أن تأخذ فى الإعتبار العلاقات الموجودة فى مثل هذه البيانات.

المخطط التمثيلى (Graph)  يعد من أكفأ الأساليب تعبيرا عن العلاقات بين هذه البيانات. لذلك، أصبح مجال تعدين أو تنقيب المخططات من اكثر المجالات تحديا هذه الأيام. بخاصة فكرة التنقيب عن المخططات الثانوية (Subgraphs) الأكثر تكرارا فى قاعدة المخططات. وذلك نظرا لإستخدامها فى نطاق واسع من التطبيقات مثل نظم المعلومات الحيوية (Bioinformatics) كما هو الحال فى تنبؤ التركيب ثلاثى الأبعاد للبروتينات.

حساب نسبة التكرار للمخططات الثانوية أثناء التنقيب عنها يعتبر من اكثر المشاكل تحديا. أما إنها تتم عن طريق اختبار التماثل الثانوى (Subgraph Isomorphism) بين المخططات أو حفظ قائمة(Embedding List) تحتوى على النقط و الروابط المتماثلة بين المخططات. هذه القوائم تحسن من وقت تشغيل الخوارزم و لكنها تستهلك المزيد من الذاكرة الرئيسية."


انشء في: خميس 22 نوفمبر 2012 08:22
Category:
مشاركة عبر